Linear Regression একটি মৌলিক পরিসংখ্যানগত মডেল যা ডেটার মধ্যে সম্পর্ক খুঁজে বের করে এবং এটি সংখ্যামূলক প্রেডিকশন করার জন্য ব্যবহৃত হয়। এটি মূলত দ্বৈত ভেরিয়েবল বা বহু ভেরিয়েবল সম্পর্ক বুঝতে ব্যবহৃত হয়। Linear Regression-এর দুটি প্রধান ধরনের পদ্ধতি রয়েছে: Simple Linear Regression এবং Multiple Linear Regression।
1. Simple Linear Regression (সরল রৈখিক রিগ্রেশন)
Simple Linear Regression একটি সরল রিগ্রেশন মডেল যা দুটি ভেরিয়েবলের মধ্যে সম্পর্ক প্রদর্শন করে। এই মডেলে, একটি স্বতন্ত্র ভেরিয়েবল (independent variable) এবং একটি নির্ভরশীল ভেরিয়েবল (dependent variable) থাকে। মূলত এটি একটি সরল সোজা রেখার মাধ্যমে সম্পর্ক গড়ে তোলে এবং সেই রেখার সাহায্যে ভবিষ্যতের মান পূর্বাভাস করা হয়।
মডেল ফর্মুলা:
যেখানে:
- হল নির্ভরশীল ভেরিয়েবল (Dependent Variable),
- হল স্বাধীন ভেরিয়েবল (Independent Variable),
- হল ইন্টারসেপ্ট (Intercept),
- হল স্লোপ (Slope),
- হল ত্রুটি (Error Term)।
উদাহরণ:
ধরা যাক, আপনি একটি কোম্পানির বিজ্ঞাপন ব্যয়ের সাথে বিক্রয় (sales) এর সম্পর্ক বুঝতে চান। এখানে, বিজ্ঞাপন ব্যয় (advertising expenditure) হল স্বাধীন ভেরিয়েবল (x), এবং বিক্রয় (sales) হল নির্ভরশীল ভেরিয়েবল (y)। আপনার লক্ষ্য হলো বিজ্ঞাপন ব্যয়ের উপর ভিত্তি করে বিক্রয় পূর্বাভাস করা।
উদাহরণ কোড:
from sklearn.linear_model import LinearRegression
import numpy as np
# উদাহরণ ডেটা (advertising ব্যয় এবং বিক্রয়)
X = np.array([[1], [2], [3], [4], [5]]) # Independent variable (advertising expenditure)
y = np.array([1, 2, 2.8, 3.6, 4.5]) # Dependent variable (sales)
# মডেল প্রশিক্ষণ
model = LinearRegression()
model.fit(X, y)
# পূর্বাভাস
predictions = model.predict(X)
print("Predictions:", predictions)
ব্যাখ্যা:
এখানে, মডেলটি X (advertising expenditure) এর সাথে সম্পর্কিত y (sales) এর জন্য একটি সরল রেখা আঁকে এবং সেখান থেকে ভবিষ্যতের বিক্রয় অনুমান করে।
2. Multiple Linear Regression (বহু রৈখিক রিগ্রেশন)
Multiple Linear Regression হল একটি রিগ্রেশন মডেল যা একাধিক স্বাধীন ভেরিয়েবল ব্যবহার করে নির্ভরশীল ভেরিয়েবলের মূল্য অনুমান করে। এটি সার্বিক সম্পর্ক ব্যাখ্যা করতে ব্যবহৃত হয়, যেখানে একাধিক ফিচারের মাধ্যমে একটি আউটপুট পূর্বাভাস করা হয়।
মডেল ফর্মুলা:
যেখানে:
- হল নির্ভরশীল ভেরিয়েবল (Dependent Variable),
- হল স্বাধীন ভেরিয়েবল (Independent Variables),
- হল ইন্টারসেপ্ট (Intercept),
- হল প্রতিটি স্বাধীন ভেরিয়েবলের জন্য স্লোপ (Slope),
- হল ত্রুটি (Error Term)।
উদাহরণ:
ধরা যাক, আপনি একটি কোম্পানির বিজ্ঞাপন ব্যয় (advertising expenditure), প্রমোশনাল ডিসকাউন্ট (promotional discount), এবং সেলস ফোর্স (sales force) এর সাথে বিক্রয়ের সম্পর্ক বুঝতে চান। এখানে তিনটি স্বাধীন ভেরিয়েবল থাকবে: বিজ্ঞাপন ব্যয়, ডিসকাউন্ট এবং সেলস ফোর্স। বিক্রয় (sales) হবে নির্ভরশীল ভেরিয়েবল।
উদাহরণ কোড:
from sklearn.linear_model import LinearRegression
import numpy as np
# উদাহরণ ডেটা (advertising ব্যয়, ডিসকাউন্ট, সেলস ফোর্স)
X = np.array([[1, 2000, 10], [2, 2500, 15], [3, 3000, 20], [4, 3500, 25], [5, 4000, 30]]) # Independent variables
y = np.array([1, 2, 3, 4, 5]) # Dependent variable (sales)
# মডেল প্রশিক্ষণ
model = LinearRegression()
model.fit(X, y)
# পূর্বাভাস
predictions = model.predict(X)
print("Predictions:", predictions)
ব্যাখ্যা:
এখানে, আমরা তিনটি স্বাধীন ভেরিয়েবল (advertising expenditure, promotional discount, sales force) ব্যবহার করে বিক্রয় (sales) পূর্বাভাস করতে চাই। মডেলটি এই ভেরিয়েবলগুলির মধ্যে সম্পর্ক তৈরি করে এবং নতুন ডেটার জন্য পূর্বাভাস দেয়।
Simple এবং Multiple Linear Regression এর মধ্যে পার্থক্য
| বৈশিষ্ট্য | Simple Linear Regression | Multiple Linear Regression |
|---|---|---|
| স্বাধীন ভেরিয়েবল | একটি (One) | একাধিক (Multiple) |
| নির্ভরশীল ভেরিয়েবল | একটি (One) | একটি (One) |
| মডেল ফর্মুলা | ||
| ব্যবহার | একমাত্র স্বাধীন ভেরিয়েবলের সাথে সম্পর্ক বিশ্লেষণ | একাধিক স্বাধীন ভেরিয়েবলের সাথে সম্পর্ক বিশ্লেষণ |
| উদাহরণ | বিজ্ঞাপন ব্যয় এবং বিক্রয় সম্পর্ক | বিজ্ঞাপন ব্যয়, ডিসকাউন্ট, সেলস ফোর্স এবং বিক্রয় সম্পর্ক |
সারাংশ
- Simple Linear Regression হল একটি সরল রিগ্রেশন মডেল যা দুটি ভেরিয়েবল (একটি স্বাধীন এবং একটি নির্ভরশীল) এর মধ্যে সম্পর্ক বিশ্লেষণ করে।
- Multiple Linear Regression হল একটি উন্নত মডেল যা একাধিক স্বাধীন ভেরিয়েবল ব্যবহার করে একটি নির্ভরশীল ভেরিয়েবলের মান পূর্বাভাস করে।
এ দুটি রিগ্রেশন মডেলই ভবিষ্যত পূর্বাভাস বা সিদ্ধান্ত গ্রহণের জন্য কার্যকরী টুল হিসেবে ব্যবহৃত হয়, তবে Multiple Linear Regression আরও জটিল এবং বৈচিত্র্যময় ডেটার জন্য উপযুক্ত।
Read more